Apprentissage par renforcement dans un système de filtrage adaptatif
نویسندگان
چکیده
RÉSUMÉ. Cet article présente une méthode incrémentale d’apprentissage des profils dans les systèmes de filtrage d’information. Cette méthode est basée sur le principe de renforcement. L’idée de base consiste à construire, à chaque arrivée d’un document pertinent, un profil " provisoire " permettant de sélectionner le document en question avec un score " fort ", puis intégrer ce profil, grâce à une descente de gradient, dans le profil global. Cette méthode est comparée à une version incrémentale de l’algorithme de Rocchio adapté au filtrage d’information. Des expérimentations effectuées sur la collection de test de référence TREC, montrent que les résultats obtenus par la méthode de renforcement sont plus intéressants que ceux obtenus par l’algorithme de Rocchio.
منابع مشابه
Filtrage bayésien de la récompense
Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...
متن کاملRELIEFS : Un système pour le filtrage adaptatif de documents textuels basé sur la notion de résonance
Résumé : Nous présentons le système RELIEFS pour RELevance Information Extraction Fuzzy System dédié au filtrage adaptatif de documents textuels. Ce système s'inspire très largement de mécanismes cognitifs intervenant dans les processus de sélection d'information. En particulier, il implémente l'idée de résonance introduite dans la théorie cognitive ART [GROS 76] qui rend compte de la façon don...
متن کاملCalibrage du seuil par linéarisation des scores par intervalles dans un système de filtrage adaptatif
RÉSUMÉ. Dans un contexte incrémental, l’adaptation du profil change la distribution des scores des documents, et doit par conséquent être suivie par l’adaptation du seuil. Dans ce papier, nous proposons une méthode qui permet d’effectuer le seuillage en se basant sur l’estimation de la distribution de probabilités des scores des documents reçus. Les paramètres des lois de probabilités suivies p...
متن کاملSous-échantillonnage topographique par apprentissage semi-supervisé
Résumé. Plusieurs aspects pourraient influencer les systèmes d’apprentissage existants. Un de ces aspects est lié au déséquilibre des classes dans lequel le nombre d’observations appartenant à une classe, dépasse fortement celui des observations dans les autres classes. Dans ce type de cas assez fréquent, le système d’apprentissage a des difficultés au cours de la phase d’entraînement liées au ...
متن کاملApprentissage par Renforcement Inverse pour la Simulation d’Utilisateurs dans les Systèmes de Dialogue
Résumé : Les systèmes de dialogue sont des interfaces homme-machine qui utilisent le language naturel comme medium d’interaction. La simulation d’utilisateurs a pour objectif de simuler le comportement d’un utilisateur humain afin de générer artificiellement des dialogues. Cette étape est souvent essentielle dans la mesure où collecter et annoter des corpus de dialogues est un processus coûteux...
متن کامل